想像一個大型語言模型(LLM)如同一位聰明但通才的學者。要將這位通才轉變為專門領域的專業人士——例如臨床放射科醫生或合約律師——我們必須在 模型適應的範疇中尋找途徑。這個範疇定義了我們如何從零樣本提示演進到深度神經網絡修改,並在硬體限制與追求 前沿(SOTA) 成果之間取得平衡。
關鍵適應模式
- 情境內學習(ICL):模型保持「凍結」狀態。它透過觀察提示中的範例來估計 $P(y|x)$。雖然速度快,但通常會因高變異性而產生幻覺。
- 對齊與穩定性:為了達到生產級別的可靠性,我們必須向右移動。微調能提供更佳的 與人類判斷的對齊 ,透過明確懲罰與真實資料模式的偏差。
- SOTA 的目標:達成頂尖表現需要權衡取捨。完整微調雖提供最大控制力,但有導致「災難性遺忘」的風險,而 PEFT(參數效率型微調) 則提供了對硬體友善的中間路徑。
實際應用範例
舉例來說,假設有一個醫療助理。使用 ICL,你在提示中提供三個症狀至診斷的範例。使用 微調,你用5萬筆醫療記錄訓練模型。後者所產生的模型能自然理解臨床術語,並展現出更高的 一致性與穩定性。